http://www.abbs.info e-mail:[email protected] ISSN
0582-9879
ACTA BIOCHIMICA et
BIOPHYSICA SINICA 2003, 35(8): 768–773
CN 31-1300/Q |
Short Communication |
Characterization
of the Copy Number of RIRE10 Retrotransposon and Transcriptional Activity of
Its LTR in Rice Genome
WANG
Rong1,2, HONG Guo-Fan1,2*, HAN Bin1*
( 1National Center for Gene
Research, Shanghai Institutes for Biological Sciences, the Chinese Academy of
Sciences, Shanghai 200233, China; 2Institute of Biochemistry and
Cell Biology, Shanghai Institutes for Biological Sciences, the Chinese Academy
of Sciences, Shanghai 200031, China)
Abstract A full-length Ty3-like
retrotransposon, named RIRE10, was identified on the long arm of chromosome 4
in rice genome. The internal region between two LTRs had another open reading frame
in the region upstream of gag-pol sequence. The transcripts from LTR region
were detected by Northern blot hybridization and RT-PCR. To assess the activity
of RIRE10 in rice genome, the copy number of its internal region and long
terminal repeat (LTR) domain were determined by dot blot analyses. Nearly 900
solo-LTR of the RIRE10 retrotransposon exist in rice genome, apart from those
LTRs that flank 65 intact RIRE retrotransposons. Based on the experimental
results, the retrotransposition of RIRE10 was speculated to be influenced by
two factors: transcriptional activity of LTR region and homologous
recombination resulting in solo-LTR.
Key
words Oryza sativa; Ty3-type
retrotransposon; transcription
_______________________________________
Received:
April 17, 2003 Accepted:
June 2, 2003
This
work was supported by the grants from the Ministry of Science and Technology,
the Chinese Academy of Sciences and the Shanghai Municipal Commission of
Sciences and Technology
*Corresponding
authors:
HONG
Guo-Fan: Tel, 86-21-64822885; Fax, 86-21-64825775; e-mail,
[email protected]
HAN
Bin: Tel, 86-21-64845260; Fax, 86-21-64825775; e-mail, [email protected]
水稻逆转录转座子RIRE10拷贝数与LTR区转录活性的鉴定
王嵘1,2 洪国藩1,2* 韩斌1*
( 1中国科学院上海生命科学研究院国家基因研究中心, 上海200233; 2中国科学院上海生命科学研究院生物化学与细胞生物学研究所, 上海200031 )
摘要 在水稻第四号染色体的长臂上鉴定了一个结构完整的Ty3型逆转录转座子RIRE10。 RIRE10两LTR间的中间区域在gag-pol的上游还包含另一个开放阅读框。
通过RT-PCR与Northern 印迹杂交检测到来自LTR区的转录产物; 根据点杂交结果,
鉴定出包含中间区域的RIRE10成员的个数以及LTR区的拷贝数。 除了65个完整的逆转录转座子所具备的两个LTR外, 水稻基因组还含有近900个RIRE10的solo-LTR。
LTR区的转录以及导致solo-LTR产生的同源重组可能影响了RIRE10成员在水稻基因组中的转座活性。
关键词 栽培稻; Ty3型逆转录转座子; 转录
逆转录转座子与逆转录病毒有相似的复制过程:
首先转录出RNA, 然后以RNA为模板通过逆转录酶合成双链DNA, 最后整合酶将双链DNA插入染色体DNA中[1]。
因而逆转录转座子的每一次转座都伴随着拷贝数的增加。 根据结构特点,
逆转录转座子分成两类: 长末端重复(long
terminal repeat, LTR)逆转录转座子与非长末端重复(non-LTR)逆转录转座子。 LTR逆转录转座子根据pol区基因的顺序与序列的相似性又分成两类: Ty1-copia与Ty3[2]。
人们采取两种互补的方法来研究LTR逆转录转座子在水稻中的拷贝数。 一种是搜寻水稻基因组BAC数据库, 归纳出LTR逆转录转座子的种类与数目[3]; 另一种方法是用逆转录转座子不同区域的片段作为探针杂交基因组DNA, 计算逆转录转座子的拷贝数[4,5]。
伴随拷贝数的鉴定, 人们也观察到逆转录转座子在植物基因组中的活性。 在水稻中,
检测到了 GAG蛋白的表达以及一个非全长的Ty3型水稻逆转录转座子RIRE9在正常生长情况下的转录[6,7]。 而水稻Tos17是一个在组织培养条件下会发生转座的Ty1-copia型逆转录转座子[8]。
虽然人们检测到逆转录转座子的转录、
翻译与转座, 但不同LTR逆转录转座子在水稻基因组中的拷贝数不同[3], 暗示着水稻基因组与不同LTR逆转录转座子间可能存在着互相平衡, 互相制约的共生关系。
在完成BAC4949(GenBank登录号: AL627350)的序列测定与分析后,
我们找到了一个结构完整的Ty3型逆转录转座子。 与已报道的其他水稻Ty3型逆转录转座子比较, 该逆转录转座子是一个新家族的成员, 我们将其命名为RIRE10 (Rice Retrotransposon
10)。 通过RT-PCR与Northern 印迹杂交,
在正常水稻组织中检测到来自LTR区的转录物。 基因组DNA点杂交计算分析后, 我们发现LTR区的拷贝数是内部区域拷贝数的11倍。 近900个RIRE10
solo-LTR的存在说明导致solo-LTR的同源重组可能抑制了RIRE10在水稻基因组中的扩增。
而LTR区转录片段的大小暗示LTR区的转录调节位点可能影响了RIRE10的完整转录以及邻近基因的表达。
1 材料和方法(Materials
and Methods)
1.1 水稻材料
水稻种子是籼稻广陆矮4号(Oryza sativa ssp. indica Guangluai 4), 由中国水稻研究所提供;种子用2%的漂白粉精消毒, 抽真空后于37
℃发芽; 将发芽后(2~4天)的种子移至网上水培(30
℃,光照12 h), 根据实验需要,
取2~4周的水稻作为材料。
将发芽后的种子于30 ℃暗培养来获取水稻黄化苗。 愈伤组织由种子盾片诱导,
每两周继代一次。
1.2 RT-PCR 扩增与Northern印迹杂交
1.2.1 水稻总RNA的抽提 我们用RNAeasy Mini试剂盒(Qiagen)抽提水稻苗或愈伤组织总RNA。
抽提到的总RNA用无RNase的DNase
(Promega)处理防止可能的基因组DNA污染。 RNA浓度由GeneQuantII
分光光度计(Pharmacia Biotech)检测。
1.2.2 RT-PCR与Northern印迹杂交 以1 μg叶或根的总RNA为模板,
oligo (dT)为引物, MMLV逆转录酶(Clontech)催化合成第一链。 第二链PCR扩增的酶是Advantage
cDNA PCR聚合酶(Clontech), 引物为CTT TAT TTT CGC CGT TTG与AGC CGA TAC AGG TTT AC。
反应条件: 95 ℃变性, 30 s; 50 ℃退火,
15 s; 68 ℃延伸, 2 min; 35 循环。 对照组仅是第一链合成时用水取代逆转录酶, 其他操作均与实验组相同。 RT-PCR产物经低熔点胶纯化,
测序检测后用于Northern印迹杂交, RT-PCR产物的序列登录号为:
AJ555842。 Northern印迹杂交操作依照Gene Images Alkphos Direct system说明书(Amersham)。
1.3 Southern 印迹杂交与点杂交
1.3.1 水稻基因组总DNA的抽提 用20 mL含7
mol/L尿素、 0.35 mol/L氯化钠、 50 mmol/L Tris-HCl (pH 8.0)、 20 mmol/L EDTA (pH 8.0)、 6.25%重蒸酚的抽提缓冲液抽提10
g水稻苗的总基因组DNA。
1.3.2 Southern 印迹杂交 用BamHI、
HindIII完全酶切10 μg基因组DNA,
每一种酶切产物分成三份电泳, 转膜后的基因组DNA酶切片段与来自LTR区的一个探针(Un)和来自内部区域的两个探针(Ext、 Gag)分别进行杂交。 杂交探针是BAC 为模板的PCR片段: 扩增Un探针的引物是TAT ATC CCC CCC ATT CG与CCA ATG GCT CGG ATT TC; 扩增Ext探针的引物是CAG
TTC CCA CGG TTT TG与CCT CAG TCG AAG AAA CG;扩增Gag探针的引物是TCA
CCA GCT AAG AGG AC与ACC GAA GTT GTT GAG CG。 PCR反应条件是:
95 ℃变性, 30 s; 54 ℃退火, 15 s; 72℃延伸,
2 min; 35 循环。 DNA聚合酶是rTaq酶(TaKaRa)。
1.3.3 点杂交PCR扩增片段 Ext、 Un分别作为探针进行水稻基因组DNA点杂交, 从而计算内部区域以及LTR区的拷贝数。 具体方法如下。 (1) GeneQuantII 分光光度计计量水稻基因组DNA以及片段Ext、 Un的浓度。
(2) 人工点上38 ng全水稻基因组DNA, 共点六点;
在同一张膜上点上含有Ext片段或 Un片段的梯度稀释液,
每种梯度稀释液重复2~3次;
经预杂交实验后, Ext片段的梯度稀释液为5 ng、
1 ng、 0.5 ng、 0.1 ng、
50 pg、 10 pg; Un片段的梯度稀释液是3.5 ng、
0.7 ng、 0.14 ng、 70 pg、
14 pg、 7 pg。 (3) 与相应的探针杂交后,
对杂交点扫描; 首先根据每个梯度的平均灰度值与对应质量的对数值作出线性关系式, 利用该等式计算出基因组DNA平均灰度值对应的探针的质量数, 再根据Kalendar等[9]的方法计算拷贝数。
2 结果(Results)
2.1 RIRE10的结构特点
我们使用BLASTX搜索GenBank分析BAC4949时, 发现46204~52158 bp这段BAC序列编码逆转录转座子Gal-Pol多聚体蛋白。 随后我们通过Staden Package 中的重复序列分析工具、 BLAST2以及同源序列搜索确定了该逆转录转座子的完整结构, 并将其命名为RIRE10。 RIRE10全长13
842 bp, 5′LTR、 3′LTR与中间区域的长度分别为3819 bp、
3849 bp与6174 bp。 RIRE10中间区域的pol基因顺序为逆转录酶(rt)-RNaseH(rh)-整合酶(int), 因而属于Ty3型。 RIRE10具有典型LTR型逆转录转座子的结构特点(图1)。 5′LTR或3′LTR的左右两个边界序列为TG..CA的倒转重复;
整个RIRE10序列的两边界是5 bp的基因组DNA(ATCTT)的正向重复。 在5′LTR下游序列中,
有一与tRNAiMet 3′末端18个碱基序列互补的引物结合位点(PBS); 而3′LTR上游的7个嘌呤形成了多嘌呤位点(PPT)。
Fig.1 Schematic representation of RIRE10 structure
5 bp (ATCTT) target site direct
duplication region (TSD) caused by retrotransposition was indicated by black
triangle; two triangles in LTR boxes showed inverted repeats (TG..CA) at the
end of LTR. Ext, Gag, Pol represented three hypothetical proteins encoded by
internal region. PBS, PPT showed primer binding site and polypurine tract
respectively.
RIRE10的两个LTR序列有0.5%的差异,
共有17个区域的碱基发生了改变, 其中14处是碱基替换, 其余三处是由于微卫星的重复数不同导致的。 RIRE10的LTR区没有某些逆转录转座子LTR区中存在的以短区域作为重复单位的重复, 而是有多类型的微卫星DNA。
如(C)n单碱基重复, (CT)n两碱基重复,
(T4C)n五碱基重复。 在3′LTR区,
(CT)n与(C)n微卫星的重复数分别为13与8,
而在5′LTR区中(CT)n与(C)n微卫星的重复数分别为17与15。 在3′LTR区, 距离(CT)n微卫星重复2碱基处有[(TC)3C4G3C]2重复, 而5′LTR区的同一位置是(TC)3C3G3C。
RIRE10中间区域可能编码的蛋白质GAG与POL位于同一转录框。 在gag序列的上游还有另一开放阅读框, 可能编码伸展蛋白(extension protein, Ext) 的同源物。 RIRE10的GAG蛋白、 逆转录酶、 整合酶分别具有逆转录病毒中相应蛋白质的结构域模式。 GAG蛋白的核酸结合结构域具有CX2CX4HX4C的特征, 而整合酶具有三个典型的亚结构域: N末端的HHCC锌指模式; 中间区域的D(35)E模式; 碳末端为G-D-X19-K-L-X2-R-T-X-GPY/F(X代表任何氨基酸)的GPY/F模式, 而且在GPY/F模式后还有60个氨基酸的染色质结构域(chromodomain)同源序列。 图2是已报道的水稻Ty3型逆转录转座子整合酶碳末端结构域的比较。
除RIRE7外, 其他逆转录转座子的整合酶在GPY/F模式后还有一个染色质结构域。
Fig.2 Alignment of the C-terminal domain of integrase of Ty3-like retrotransposons in rice
Gray boxes represented conserved GPY/F modules
and dots indicated gaps. Black arrow showed the start site of chromodomain
sequence. The accession numbers for the elements are as following:
RIRE2, AB030283; RIRE10, AL627350; RIRE3, AB014738; RIRE8B, AB014741.1; RIRE7,
AB033235.
2.2 LTR区的转录
LTR区包含逆转录转座子起始与终止转录以及各种调节转录的信号序列。 我们通过植物顺式调控元件预测软件分析了LTR区的序列, 找到了多个TATA盒与转录终止信号。 而GeneScan预测RIRE10的LTR区有转录产物。 我们在软件预测的外显子区设计了引物, 通过RT-PCR反应扩增得到特异的738
bp长的LTR区片段[图3(A)]。
该RT-PCR产物的序列登陆号为: AJ555842。 我们用此片段作为探针分析了不同水稻组织中LTR区的转录[图3(B)]。
在所检测的组织里, 都有800 bp的条带;
仅在愈伤组织中检测到近7 kb的大片段。 除绿苗根外, 在其他组织中还观察到2.6~1
kb的片段。
Fig.3 Detection of the transcripts of LTR region
(A) Amplification of LTR transcripts from
leaf (L) or root (R) sample by RT-PCR. Lane 1 (Lc) and 2 (Rc) were the control
groups. The marker (M) order is 2 kb, 1 kb, 750 bp, 500 bp, 250 bp, 100 bp(up
to down). (B) 30 μg
total RNA, from green seedling leave (GL), green seedling root (GR), etiolated seedling
leave (EL), etiolated seedling root (ER), C(calli) were separated on
formuldehyde gel then transferred to N+-nylon membrane. Number on right
indicated the lengths of bands. Ribosomal RNA was stained with ethidium bromide
to verify the equal loading of samples and shown at the bottom.
2.3 RIRE10的拷贝数
逆转录转座子的典型特征就是每一次转座都伴随着逆转录过程与拷贝数的增加, 因而通过检测基因组中逆转录转座子的拷贝数, 可估计其转座活性。
我们通过Southern印迹杂交与点杂交来检测RIRE10在水稻基因组中的活性。
RIRE10三个区域的DNA片段被选作探针杂交基因组DNA的HindIII或BamHI酶切片段。 如图4(A)所示,
三个探针的杂交图谱都是弥散型条带, 而Un探针的杂交图的弥散程度大于Ext或Gag 探针的。 弥散型的基因组酶切杂交图说明基因组中存在较高拷贝数的RIRE10序列, 而且含有LTR区的序列的拷贝数要大于含有内部区域的序列的拷贝数。 基因组酶切片段杂交结果表明水稻中存在着RIRE10家族的其他成员, 然而不能得出成员个数。 因而我们通过点杂交计算RIRE10的拷贝数, 图4(B)、 4(C)是杂交点的灰度值与质量的对数值作图得到的线性方程式。 根据这个等式, 38 ng基因组DNA的灰度值相当于4.968
pg的Ext(866 bp)的灰度值, 而相当于45.242
pg的Un(561 bp)的灰度值。 水稻单倍体基因组为4.3×108 bp, 因而在每个单倍体水稻基因组中, 有(1024±19)个LTR,
有(65±8)个具中间结构的RIRE10成员。 同时, 我们用RIRE10中间区域序列(6174
bp)搜寻Japonica的BAC库,
共找到51个同源性在93%以上的RIRE10成员。 实验值(65个)大于BAC文库搜索值(51个)可能来自以下原因: 同源搜寻时, 我们筛出了同源区域小于4 kb的序列;BAC文库中可能没有包括某些含有RIRE10同源序列的基因组异染色体片段。
而基因组点杂交则不受这两个因素影响。
Fig.4 The copy number of RIRE10 internal or LTR region in rice genome
(A) Southern blot hybridizations. Completely
digested genomic DNA was run on 0.8% agarose gel. Three nylons were separately
probed with Un, Ext or Gag fragments. Marker was indicated on left. B, 3 μg
BamHi; H, 3 μg
HindIII. (B, C) The equations and diagrams of dot blots using Ext or Un as probes.
3 讨论(Discussion)
逆转录转座子的转录以及与转座相关的蛋白质的翻译都依赖着寄主的转录与翻译系统, 而LTR区的序列则参与对逆转录转座子转录的调控。
整合酶是逆转录转座子以自身序列为转录模板, 利用寄主的转录与翻译系统在寄主细胞中合成的。 整合酶是预插入复合物的一个成员, 通过与寄主DNA以及其他蛋白质的相互作用影响着逆转录转座子的基因组插入位点[10,11]。
以前人们认为整合酶羧基末端不具有结合特异DNA序列的结构域。 然而随着对整合酶的研究, 人们发现整合酶的羧基末端参与了特异DNA序列的识别。 Ty3具有专一插入RNA基因的特点, 如果用MMLV病毒整合酶羧基末端取代Ty3整合酶羧基末端,
这样构建出的Ty3/MMLV嵌合整合酶使得Ty3丢失了专一插入的特点[12]。 RIRE10整合酶羧基末端具有染色质结构域(chromodomain)的同源序列。 染色质结构域最初在果蝇多线蛋白(Polycomb, Pc)与人异染色质蛋白(HP1)中发现,
功能分析发现这种蛋白质序列模式参与了染色质位点的结合[13]。 RIRE7与Tos17都发现了插入位点的偏爱性[14,15]。 羧基末端无染色质结构域的RIRE7倾向插入近着丝粒区异染色质中的串联重复序列。
而51个与RIRE10同源的逆转录转座子大多位于基因富聚区。 RIRE10整合酶可能通过羧基末端与DNA序列或其他蛋白质作用而对插入位点进行选择。
全长RNA的转录是逆转录转座子转座的第一步。 RIRE10的全长RNA至少有10
kb长, 因而在愈伤组织检测到的7 kb大片段仍是RIRE10型逆转录转座子的不完全转录产物。 不同大小的LTR短片段转录产物可能完全来自RIRE10的LTR区, 也可能是邻近基因起始或终止于LTR区的转录产物。 我们推测RIRE10的LTR区转录起始或终止位点以及其他转录调控序列可能参于邻近基因的表达调控, 而LTR区的转录也可能影响到RIRE10自身的完整转录。
逆转录转座子插入寄主基因组后, 仍面临着序列丢失的危险。 在水稻的进化过程中,
逆转录转座子RS1家族的许多成员的整合酶区域都发生了原位缺失[16]。
许多LTR逆转录转座子甚至丢失了中间区域与一个LTR, 仅剩下一个LTR作为插入事件的痕迹[9]。
分析数据库中RIRE10 中间区域的51个同源序列时,
我们也发现多数成员的中间区域序列有不同片段的缺失、 插入与异位。
RIRE10的LTR包含(CT)n两碱基重复。 两核苷酸微卫星不仅用于系统演化的研究, 而且人们发现两碱基重复还参与调节同源重组活性。 Gendrel等[17]研究发现,(CA/GT)n重复影响了酵母的同源重组。 大肠杆菌RecA蛋白与酿酒酵母RadS1的重组蛋白质对含有GT、 CT、
CA两碱基重复的单链DNA有很强的结合[18]。 排除完整结构成员的约140个LTR外, 还有近900个RIRE10 LTR(solo-LTR)存在于水稻基因组中。 这些LTR可能是RIRE10型逆转录转座子发生同源重组, 丢失了中间区域和一个LTR后而剩下的LTR。
LTR型逆转录转座子与有机体在长期共同适应与演化的过程中, 有机体对逆转录转座子的转录、
翻译以及位点的插入等生命周期有不同的调控; 而逆转录转座子LTR区的激素效应元件或增强子序列, 可能参与了邻近基因的转录调节。 RIRE10 LTR区的转录以及大量RIRE10 solo-LTR的存在, 反映了水稻基因组对RIRE10转座活性的一种可能调节机制。
References
1 Boeke JD, Corces VG.
Transcription and reverse transcription of retrotransposons. Annu Rev
Microbiol, 1989, 43: 403-434
2Xiong
Y, Eickbush TH. Origin and evolution of retroelements based upon their reverse
transcriptase sequences. EMBO J, 1990, 9: 3353-3362
3 McCarthy EM, Liu J,
Lizhi G, McDonald JF. Long terminal repeat retrotransposons of Oryza sativa.
Genome Biol, 2002, 3: research 0053.1-0053.11
4 Hirochika H, Fukuchi A,
Kikuchi F. Retrotransposon families in rice. Mol Gen Genet, 1992, 233: 209-216
5Wang
S, Liu N, Peng K, Zhang Q. The distribution and copy number of copia-like
retrotransposons in rice (Oryza sativa L.) and their implications in the
organization and evolution of the rice genome. Proc Natl Acad Sci USA, 1999,
96: 6824-6828
6 Vicient CM, Jskelinen
MJ, Kalendar R, Schulman AH. Active retrotransposons are a common feature of
grass genomes. Plant Physiology, 2001, 125: 1283-1292
7 Li ZY, Chen SY, Zheng
XW, Zhu LH. Identification and chromosomal localization of a transcriptionally
active retrotransposon of Ty3-gypsy type in rice. Genome, 2000, 43: 404-408
8 Hirochika H, Sugimoto
K, Otsuki Y, Tsugawa H, Kanda M. Retrotransposons of rice involved in mutations
induced by tissue culture. Proc Natl Acad Sci USA, 1996, 93: 7783-7788
9 Kalendar R, Tanskanen
J, Immonen S, Nevo E, Schulman AH. Genome evolution of wild barly (Hordeum
spontaneum) by BARE1 retrotransposon dynamics in response to sharp
microclimatic divergence. Proc Natl Acad Sci USA, 2000, 97: 6603-6607
10 Downs JA, Jackson SP. Involment
of DNA end-binding protein Ku in Ty element retrotransposition. Mol Cell Biol,
1999, 19: 6260-6268
11 Malik HS, Eickbush TH. Modular
evolution of the integrase domain in the Ty3/Gypsy class of LTR
retrotransposons. J Virol, 1999, 73: 5186-5190
12 Dildine SL, Respess J, Jolly
D, Sandmeyer SB. A chimeric Ty3/Moloney murine leukemia virus integrase protein
is active in vivo. J Virol, 1998, 72: 4297-4307
13 Platero JS, Hartnett T,
Eissenberg JC. Functional analysis of the chromo domain of HP1. EMBO J, 1995,
14: 3977-3986
14 Kumekawa N, Ohmido N, Fukui
K, Ohtsubo E, Ohtsubo H. A new gypsy-type retrotransposon, RIRE7: Preferential
insertion into the tandem repeat sequence TrsD in pericentromeric
heterochromatin regions of rice chromosomes. Mol Genet Genomics, 2001, 265: 480-488
15 Yamazaki M, Tsugawa H, Miyao
A, Yano M, Wu J, Yamamoto S, Matsumoto T et al. The rice retrotransposon Tos17
prefers low-copy-number sequences as integration targets. Mol Genet Genomics,
2001, 265: 336-344
16 Liu B, Wendel JF. Retrotransposon
activation followed by rapid repression in introgressed rice plants. Genome,
2000, 43: 874-880
17 Gendrel CG, Boulet A, Dutreix M.
(CA/GT) (n) microsatellites affect homologous recombination during yeast
meiosis. Genes Dev, 2000, 14: 1261-1268
18 Biet E, Sun J, Dutreix M.
Conserved sequence preference in DNA binding among recombination proteins: An
effect of ssDNA secondary structure. Nucleic Acids Res, 1999, 27: 596-600